前百度研究院副院长余凯:再多的数据也不是优势,数据+深度学习才能形成商业壁垒|研习社12月4日演讲实录
为什么深度学习如此重要?过去几年,Google、微软、Facebook、百度都成立了深度学习研究院?因为它是最接近人类大脑、最适合大数据时代的。
12月4日,颠覆式创新研习社《创新模块之人工智能》登台,作为前百度研究院副院长,深度学习实验室主任,余凯说,随着数据规模的增长,过去传统的人工智能算法并不能处理好,效果并不增长。而深度学习可以处理大数据,这通常使得数据成为商业壁垒。
点击下方图框,可听余凯演讲精彩语音:
演讲者|余凯(前百度研究院副院长,地平线机器人创始人)
谢谢大家这么早来到这里,冬天非常寒冷,但是这里大家热情非常火热,是因为对创新的热情,我也是你们其中的一员。人工智能将怎么改变我们的世界,大家都充满期待,这也是我每天工作的动力。
现在的人工智能技术发生到什么样的程度?前几天在国家会议中心有世界机器人大会,机器人长得跟人一样,惟妙惟肖,还可以跟它对话。朋友说,技术怎么这么牛?我说,兄弟,那后面肯定有人,机器达不到这样的水平。
技术在什么样的水平?不是山崩地裂,处于一个润物细无声的状态,但是我们还是能够隐隐约约听到轰隆隆的雷声,这是我对当前人工智能所处在的状态的概括,于无声处听惊雷。
人工智能过去50年进展不大
错在希望用简单的规则模拟复杂系统
现在,数据提供了了解复杂世界的能力
什么是人工智能?机器人有一些基本的能力。首先,它具有感知的能力。其次,对客体对象的理解。这个地方能不能走,可以从哪里走。三是决策,根据感知和理解做出决策。
为什么在过去的50年时间里面,人工智能煽起了大家这么强大的热情,但是没有取得我们所期待的进展。一个本质的问题,过去大部分的人工智能系统,我们希望以一个所谓的科学演绎的方式来进展。
过去受到自然科学的影响,也就是从一个基本的法则出发推导出一个复杂的系统,比如说通过牛顿的三大定律,很多的经典力学的问题都可以解决。能不能通过一个简单的规则,比如说If smoking then lung cancer。
从这样的系统思维出发,导致人工智能系统通常会过于简单,因为我们希望模拟的是一个复杂系统的行为。但是这是没有办法实现的,原因如下:
第一,这个世界纷纭复杂,问题之间互相有复杂的作用和影响,形成一个复杂的网络系统,这样的复杂系统很难利用一个简单的公式来描述。
第二,有很多的因素你能观测到,但很多你观测不到,因为你没有观测到系统运行里面所有的问题。
第三,因为现实世界纷繁复杂,你自己直接抓住它的规律,描述它这是非常难的。所以让它从数据中学习,随着数据进化这是关键。
大数据时代它的意义是什么?本质上是因为数据提供了我们一种了解复杂世界的能力。
深度学习为何影响巨大?
最接近人类大脑、适合大数据
它有整体性优化目标,这是革命性的
大脑神经原从一个简单的神经原出发构造复杂的网络,构造了我们今天最前沿的人工智能技术,这是我们最近经常听到的深度学习。
深度学习在2014年的时候,被麻省理工学院的科技评论杂志评为十个突破性的技术,Google、微软、Facebook、百度都成立了深度学习研究院。
我们过去很少看到一个技术从高校出来,短暂时间影响了最大规模的公司,并且产生很大的实际价值。为什么?我认为主要有四方面的原因。
第一点,这样的模型和人工智能系统,是当前我们可以找到的,最接近人类大脑的人工智能系统。
今天整个大脑的分层还是未知,但是对有一些进展我们了解的还是比较清楚的。
第二点,深度学习特别适合大数据。
过去的模型方法对大数据的处理效果不好,推广误差很大。由于你采集的数据有噪声,样本不够多,计算不是完美的,可能产生的机制并不完全跟你的应用场景一致。
随着数据的规模增长,过去传统的人工智能算法,效果不增长。它的算法不能处理更大规模的数据,算不动了。
深度学习模型足够复杂,可以处理大数据,所以使得它在数据规模的增长情况下,能够不断提升它的效果。这通常使得数据成为商业壁垒。
你有更多的数据,你并不比你的竞争对手有更强的优势。但是如果你有一个这样的曲线模型,才能真正的让数据成为一个商业壁垒。
第三点,深度学习是一套灵活的建模语言,根据不同的问题设计不同的网络结构解决它。
怎么写出好文章跟怎么样做出人工智能系统是相通的。写出好文章,你需要对语言的驾驭能力非常强,还需要感知生活的能力很强。
深度学习是一样的,除了对数据、计算工具、建模语言、深度神经网络灵活,还需要对要解决的问题有非常深刻的理解。
第四点,end-to-end learning,端到端的学习。
从数据感知到预处理,再到各种环节的特征抽取,还有特征变换。最后你得到了一个数据形式,你可以基于这个数据形式做预测,做识别,做判断。
过去大部分的研究工作在最后这部分,数据已经准备好了,你做最后的处理。之前的步骤被忽略。如果开始把有用的信息丢掉,没有用的信息留下来,后面的算法再精巧也弄不回来。
深度学习从2006年开始就提出了全新的思想,把以前支离破碎的步骤、统筹都是人工手动的步骤,变成一气呵成的系统。尽量减少人工干预,这是一个整体的优化目标,而不是一个局部的优化目标。
这个变化是革命性的,人工智能在很多的方面有进展,很重要的就是端到端的学习思想。
人工智能已在各方面成功应用
但是机器并没有比人类更强
越通用的处理器,效果越差
我们来看一些成功的应用,最近人工智能技术在图像和计算机视觉的领域,其实取得了非常大的进展。
从2010年到今天这个水平在不断的提升,由于深度学习的变化带来了进展。人的错误率在5%左右,今天最好的程序深度神经网络在这件事情上已经超越了人。
在这件事情计算机做的比人好,是不是代表了计算机真的很牛,其实没有。
比如数据集里面图像分类,是给青蛙分类,随便找一个人来,他哪知道各种细分的青蛙种类,特别训练的神经网络可以在这件事情上做得比人更好,但是你如果找真正的生物学家,他做的比机器人更好。
现在自动驾驶有非常大的进展,推进的速度比我想象还快。很多车厂的技术,比如说福特、特斯拉等等都有涉及到。
有一次我看到有一个用户体验,有一个人回家,他很困真的是睡着了,后来他醒了,发现幸亏有自动驾驶的驾驶技术,使他不至于产生交通事故。人工智能的技术真的就是让人的生活更加美好。
在语音也是另外的应用,我2012年回中国的时候组建语音团队,基本上招不到人。因为过去十多年的时间里面,所有培养的语音人才都转专业了,找不到工作。
但是12年以来,因为深度学习,使得语音识别的准确率越来越高。12年移动搜索我们的识别率在80%,今天已经达到了90%以上。
在过去的几年里,我们云端基于大数据构建了强大的能力,但是下面我们很多的智能硬件前端还需要部署,使得很多的处理不要到云端,处理完了再回来,而是很多的东西在本地解决就完成。
前端处理感知的决策问题,是不是需要专用的处理器处理人工智能的问题呢?我们想想,人类大脑是通用处理器还是专用处理器?
人从猴子到猿人,再到现在,能够生存并且脱颖而出,就是因为大脑是专门的针对这个物种的繁衍需要一些特殊的能力专门优化过来的。跟这个没有关系的东西,大脑是不擅长的,这是一个专用的处理器。
1758x629是多少?大脑的计算是很慢的,但是这个很慢的大脑,会打乒乓球,可以开车,是因为对这些问题做了专门的处理。
这反映到硬件设计领域,如果你越通用,你要什么都做,这样的处理器一定牺牲效果。如果你是专门优化的话,会损失通用性,但是对专门优化的那部分会有上千倍的效果。
人与机器最自然的相处就是交互
交互的终极程度是脑机交互
面对机器威胁,只能通过交互突破来救赎人类
我在互联网行业工作了很长的时间,分享一下人工智能扮演了什么样的角色,未来怎么改变我们的生活。
比如自动驾驶技术,将来会产生什么样的改变。你可能租了一个车到了家里以后不需要还车,车自动就回去了。跟它在需要的一刹那间有连接,才是重要的,这是互联网给这个世界带来的变化。
我们讲了连接,人怎么最自然的方式和机器相处呢?关键词就是交互。把世界上所有的内容、服务、信息,使机器可以掌握的方式整理加工并且管理起来。
我们看交互,其实牵引了过去30年信息产业的变化。最伟大的公司就是苹果,苹果在PC时代的时候,它引领了用户界面,鼠标。在移动时代的时候,它使得在连接人和世界的关键链条上,让机器和人更近了。
最早使用键盘不是那么的容易,要花很多的时间训练打字。但是鼠标就容易得多。触摸更加自然,iPad诞生了以后,小朋友不用学都会用。因为触摸这件事情可能是人骨子里的东西,不需要学的。
在未来的话,很多的智能硬件跟你是有一定的距离,你不能随时拿出键盘来敲,你能够表达的可能更加自然的方式就是语音。甚至是手势。
交互的终极程度是什么?心灵感应吗?脑机交互,那个时候人和机器的距离是零距离的,所以你看人连接时候的时候有两个步骤,人到机器,机器到世界。
巨大的机会就是先让人和机器没有距离,把这个距离缩短,这件事情非常关键。今天比较苹果和Android会发现苹果不一样,Android总是差一点点,就是因为一点点的差别导致用户选择苹果。因为人需要离机器很近。
未来是什么样子的?连接人和世界,交互和索引。未来发展到极致是什么样的?人跟机器完全融为一体。
大家经常问我一个问题,人工智能发展到一定的阶段,会不会对人类生存造成威胁。有可能。
因为机器的进化速度按照目前的发展,它在很多方面可能超出了人的范围。机器的学习,知识的传播对机器来讲是一个光纤网络传输而已,立刻就可以实现。而人类需要接受漫长的教育。
救赎的方式只有一条,在交互的这件事情上取得突破性的进展,使得人和机器的交互一致。可能是某一种设备芯片怎么落在你的身体里面,你跟其它的机器完全瞬间迅速地交流控制能力就会提高。人如果学习机器,那一定比机器更加强大。
未来关键的关键就在于人机交互这件事情,能不能取得突破性的进展。
我们做技术的人会不断地提机器,这是我们技术的目标,但是这个东西本身并没有为社会真正的带来什么样的改变,只是验证了机器多么的强大。
另外一个例子就是搜索引擎,它也是一个很强大的机制,让人无论身处什么地方,什么社会阶层,跟信息和知识的距离是平等的。伟大的技术,目的不在于让机器更加的伟大,而是让每一个平凡的人变得伟大。
* 本文根据余凯在颠覆式创新研习社的课程内容整理而成,欢迎转发分享,网站或期刊转载请联系微信warmly11。
探索需求、验证需求、切入需求
是迈向成功产品的第一步
1月16日/17日,上海,社员免费
研习社产品学院第二课 《用户和需求分析》
Airbnb、聚美优品、爱空间、91助手、长江教授
五大牛导教你如何挖掘用户需求
点击下方阅读原文报名《用户和需求分析》网络直播